بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز
Authors
abstract
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش های یادگیری ماشین بر اساس ویژگی های صفحات اشاره کرد. ازجمله الگوریتم های یادگیری ماشین که در این حوزه استفاده شده است ولی نتایج قابل توجهی را ارائه نکرده، الگوریتم ماشین بردارپشتیبان[i] (svm) است. استفاده از هسته در ساختار طبقه بند svm باعث می شود که داده هایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیش تر بتوانند با مدل خطی تفکیک پذیر شوند. این کار باعث افزایش دقت تفکیک کنندگی مدل یادگیری ماشین می شود. اخیراً توسعه ایی از svm با نام svm جفتی[ii] (tsvm) ارائه شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه[iii] برای تفکیک نمونه های هر کلاس استفاده می کند و توانسته نتایج بهتری در طبقه بندی ارائه کند. به دلیل استفاده از دو ابرصفحه در tsvm، لذا بهتر است تا از هسته های چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمی توان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینه سازی ترکیب های بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (ga) استفاده شده است که با بهره گیری از آن در فرآیند تصمیم گیری هر اَبَرصفحه tsvm، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیاده سازی و ارزیابی روش پیشنهادی، از مجموعه دادگان uk-2006 و uk-2007 استفاده شده است که نتایج حاصل بیانگر مؤثر بودن ایده پیشنهادی در این پژوهش است.
similar resources
بهینهسازی هستههای چندگانه در ماشینبردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریبآمیز
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخصگذاری آنها، قابلیت جستجوی سریع اطلاعات را به کاربران میدهند. یکی از چالشهای مهم در استفاده از این ابزار، صفحاتی هستند که از آنها بهعنوان صفحات فریبآمیز نام برده میشود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که میتوان به روشهایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از رو...
full textارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی
امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد...
15 صفحه اولرتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز
با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...
15 صفحه اولبررسی عملکرد الگوریتم های فراابتکاری جمعیت مبنا به منظور بهینه سازی پارامترهای ماشین های بردارپشتیبان درطبقه بندی تصاویرپلاریمتریک راداری
با توجه به اینکه استفاده از پلاریزاسیون های مختلف امواج الکترومغناطیسی در تصویربرداری پلاریمتریک راداری اطلاعاتی غنی از جنبه های مختلف عوارض را فراهم می کند. امروزه تصاویر پلاریمتری به عنوان ابزار قوی و کارآمد در زمینه ی شناسایی عوارض مختلف در مناطق جغرافیایی پیچیده مورد توجه قرارگرفته اند. به منظور استخراج اطلاعات، طبقه بندی این تصاویر حائز اهمیت می-باشد. طبقه بندی کننده ی ماشین های بردار پشتی...
full textکاربرد شبکه های عصبی در بهینه سازی چینش بسته های سوخت راکتورهای هسته ای PWR
در فرآیند مدیریت سوخت نیروگاه هسته ای
full textMy Resources
Save resource for easier access later
Journal title:
مهندسی برق دانشگاه تبریزجلد ۴۶، شماره ۴، صفحات ۱۳۵-۱۴۵
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023